پایان نامه کارشناسی ارشد
مهندسی فناوریِ اطلاعات، گرایشِ تجارتِ الکترونیک
عنوان:
چارچوبی جدید برای تشخیصِ مرجع مشترک و اسم اشاره در متون پارسی
استاد راهنما:
دکتر بهروز مینائی بیدگلی
برای رعایت حریم خصوصی نام نگارنده پایان نامه درج نمی شود
تکه هایی از متن پایان نامه به عنوان نمونه :
(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)
فهرست مطالب:
فصل ۱: آشنایی با تشخیص مرجع مشترک……………………………………………………………………1
1-1. مقدمه و بیان مسئله……………………………………………………………………………………………. 1
1-2. بررسی ارتباطات هممرجعی………………………………………………………………………………. 6
1-2-1. هممرجع در مقابل پیشایند………………………………………………………………………………….. 9
1-2-1-1. ارتباط هممرجع………………………………………………………………………………………… 10
1-2-1-2. ارتباط پیشایندی………………………………………………………………………………………… 11
1-2-2. تحلیل پیشایند……………………………………………………………………………………………….. 16
1-2-3. تحلیل مرجع مشترک………………………………………………………………………………………… 16
1-2-4. تقابل تحلیل مرجع مشترک و تحلیل پیشایندی……………………………………………………….. 17
1-3.جمعبندی………………………………………………………………………………………………………… 20
فصل 2 : بخش اول……………………………………………………………………………………… 21
2-1-۱. پیشینه تشخیص مرجع مشترک…………………………………………………………………………… 21
2-1-۲. روشهای زبانشناسی…………………………………………………………………………………………….. 22
2-1-۲-1. فاکتورهای حذف کننده…………………………………………………………………………….. 23
2-1-۳-۲-۱. تطبیق جنس و عدد……………………………………………………………………….. 23
2-1-۳-۲-۱. تطبیق معنایی…………………………………………………………………………………. 24
2-1-۲-۲. فاکتورهای امتیاز دهنده …………………………………………………………………………… 24
2-1-۳-۲-۱. مشابهت نحوی…………………………………………………………………………………. 24
2-1-۳-۲-۱. مشابهت معنایی……………………………………………………………………………….. 25
2-1-۳-۲-۱. بارز بودن…………………………………………………………………………………………… 25
2-1-۳. روشهای یادگیری ماشین…………………………………………………………………………………….. 27
2-1-۳-۱. ویژگیها………………………………………………………………………………………………………. 28
2-1-۳-۲. مدلهای جفت اشاره………………………………………………………………………………….. 28
2-1-۳-۲-۱. رده بندی جفت عبارتهای اسمی………………………………………………….. 32
2-1-۳-۲-۱-1. درخت تصمیم………………………………………………………………………… 33
2-1-۳-۲-۲.افراز……………………………………………………………………………………………………… 35
2-1-۳-۲-۲-۱.درختِ بل………………………………………………………………………………….. 36
2-1-۳-۲-۲-۲. افراز گراف……………………………………………………………………………….. 38
2-1-۳-۳. روشهای مبتنی بر پیکره……………………………………………………………………………… 40
2-1-۳-۴. روشهای جایگزین…………………………………………………………………………………………. 44
2-1-۳-۴-۱. روش همآموزی…………………………………………………………………………………….. 44
2-1-۳-۴-۲. مدل احتمالاتی مرتبه اول…………………………………………………………………… 46
2-1-۳-۴-۳. رتبهبندی………………………………………………………………………………………………. 47
2-1-۳-۴-۴. فیلدهای تصادفی شرطی……………………………………………………………………… 49
2-1-۳-۴-۵. خوشه بندی………………………………………………………………………………………….. 51
2-1-۴. جمعبندی………………………………………………………………………………………………………. 56
فصل 2: بخش دوم…………………………………………………………………………………….. 57
2-2-۱. پیکره نشانه گذاری شده توسط اطلاعات هممرجع…………………………………………………. 58
2-2-۲. پیکره بیژنخان………………………………………………………………………………………………….. 59
2-2-۳. پیکره لوتوس…………………………………………………………………………………………………….. 60
2-2-۴.شیوه های نشانه گذاری پیکره لوتوس…………………………………………………………….. 62
2-2-۴-۱. نشانهگذاری انواع موجودیتها………………………………………………………………………….. 62
2-2-۴-۱-۱. موجودیت شخص……………………………………………………………………………………… 64
2-2-۴-۱-۲. موجودیت سازمان……………………………………………………………………………………… 64
2-2-۴-۱-۳. موجودیت مکان…………………………………………………………………………………………. 66
2-2-۴-۱-۴. موجودیت سیاسی……………………………………………………………………………………… 66
2-2-۴-۲.کلاس هر موجودیت……………………………………………………………………………………………. 68
2-2-۴-۲-۱.غیر ارجاعی……………………………………………………………………………………………….. 69
2-2-۴-۲-۲.ارجاعی………………………………………………………………………………………………………. 69
2-2-۴-۲-۲-۱.ارزیابی به شکل منفی……………………………………………………………………… 69
2-2-۴-۲-۲-۲.ارجاعی خاص………………………………………………………………………………….. 70
2-2-۴-۲-۲-۳.ارجاعی عمومی……………………………………………………………………………….. 70
2-2-۴-۲-۲-۴.ارجاعی زیر مشخص شده………………………………………………………………. 70
2-2-۴-۳.انواع اشاره/سطوح اشاره…………………………………………………………………………… 71
2-2-۴-۳-۱.اشاره ساده………………………………………………………………………………………………….. 72
2-2-۴-۳-۱-۱.محدوده اشاره………………………………………………………………………………….. 72
2-2-۴-۳-۱-۲. هسته اشاره……………………………………………………………………………………. 72
2-2-۴-۳-۱-۳.انواع اشاره ساده………………………………………………………………………………. 72
2-2-۴-۳-۲.ساختارهای پیچیده………………………………………………………………………………………. 74
2-2-۴-4-۲-۱.ساختارهای عطف بیان یا بدل……………………………………………………….. 75
2-2-۵.جمعبندی………………………………………………………………………………………………………… 75
فصل 3: الگوریتمهای پیشنهادی……………………………………………………………….. 76
3-۱. رده بندی دودویی…………………………………………………………………………………………… 76
3-1-1.جدا کنندههای خطی………………………………………………………………………………… 77
3-1-1-1 پرسپترون……………………………………………………………………………………………… 78
3-1-1-2 ماشین بردار پشتیبان…………………………………………………………………………………….. 80
3-1-1-3 درخت تصمیم………………………………………………………………………………………………… 85
3-۲.خوشه بندی…………………………………………………………………………………………………………. 88
3-2-1 .الگوریتمهای افراز بستهای…………………………………………………………………………………… 89
3-2-1-1 .خوشه بندی سلسله مراتبی پایین به بالا……………………………………………………. 90
3-2-1-2 .آموزش الگوریتم خوشهبندی سلسله مراتبی…………………………………………….. 93
3-3.جمعبندی……………………………………………………………………………………………………….. 96
فصل 4: سیستم ارزیابی…………………………………………………………………………….. 97
4-۱.مقدمه………………………………………………………………………………………………………………. 97
4-۲.سیستم شناسایی اشاره لوتوس………………………………………………………………….. 98
4-2-1 .بانک اطلاعاتی…………………………………………………………………………………… 98
4-2-2.سیستم شناسایی اشاره………………………………………………………………………….. 102
4-3.تشخیص اشارههای هم مرجع……………………………………………………………………………….. 103
4-3-1 ویژگیها…………………………………………………………………………………………………….. 104
4-3-2.الگوریتم یادگیری…………………………………………………………………………………….. 105
4-3-3.معیار ارزیابی…………………………………………………………………………………………….. 107
4-3-4.نتیجه ارزیابی……………………………………………………………………………………… 110
4-3-4-1.نتایج بدست آمده……………………………………………………………………………………….. 110
4-3-4-.2چالشها و تحلیل خطا……………………………………………………………………………….. 112
4-4.جمعبندی……………………………………………………………………………………………………… 115
فصل 5 :نتیجه گیری و پیشنهادها……………………………………………………………… 116
5-۱.نتیجه گیری………………………………………………………………………………………………….. 116
5-2.پیشنهادها…………………………………………………………………………………………………… 118
فصل .6 منابع………………………………………………………………………………………….. 121
چکیده:
پردازش زبان طبیعی شامل وظایفی همچون استخراج اطلاعات، خلاصهسازی متن، پرسش و پاسخ می باشد که همگی نیاز دارند تا تمام اطلاعاتی که در مورد یک موجودیت در متن وجود دارد شناسایی شوند. بنابراین وجود سیستمی که بتواند مسئله هممرجع را بررسی نماید، کمک شایانی به انجامِ موفقیتآمیز این وظایف خواهد نمود. روشهای تشخیص مرجع مشترک را میتوان به دو دسته روشهای زبانشناسی و روشهای یادگیری ماشین تقسیم نمود. روشهای زبانشناسی بیشتر به اطلاعات زبانشناسی نیاز دارند، البته مشکل این روشها این است که پر خطا و طولانی میباشند. از طرف دیگر روشهای یادگیری ماشین کمتر به اطلاعات زبانشناسی نیاز دارند و نتایج حاصل از آنها قابل اعتمادتر است. در این پایان نامه تلاش میکنیم تا فرآیند تشخیص مرجعمشترک را مورد مطالعه قرار دهیم و چارچوبی ارائه دهیم تا بتواند علاوه بر شناسایی اشاره ها، عبارتهای هممرجع را نیز تشخیص دهد. به همین منظور باید سه رکن اساسی کار را که پیکره نشانه گذاری شده، سیستم شناساییِ اشاره و محدوده آن، و الگوریتم پیشنهادی پیشبینی عبارتهای اسمی هممرجع را مبنای کار قرار دهیم. درهمین راستا، در قدم اول، پیکرهای با نشانه هایی شامل محدودهی اشاره، نوع اشاره، هستهی اشاره، نوع موجودیت، نوع زیر گروه موجودیت، کلاس موجودیت تهیه میکنیم، این پیکره میتواند به عنوان اولین پیکره دارای نشانه های اشاره و هممرجعی، مبنای کار بسیاری از پژوهشهای مربوط به شناسایی و کشف اشاره و تحلیل هممرجعی قرار گیرد. همچنین با استفاده از این پیکره و بررسی قوانین و اولویتهای میان اشاره ها، سیستمی ارائه میکنیم که اشاره های موجود در متن را شناسایی کرده و سپس نمونه های مثبت و منفی را از پیکره لوتوس استخراج میکند. در نهایت نیز با استفاده از الگوریتمهای یادگیری پایه درخت تصمیم، شبکه عصبی و ماشین بردار پشتیبان، نمونه های حاصله را مورد ارزیابی و مقایسه قرار دادیم. نتایج حاصل نشان میدهد که یادگیر شبکه عصبی، نسبت به سایرین عملکرد بهتری دارد.
فصل اول
1-1- مقدمه و بیان مسئله
امروزه رایانه در تمام لایههای زندگی بشر نفوذ کرده است. بطوریکه استفاده از فناوری رایانه در حوزه زبانشناسی، بیش از پیش احساس میشود. «پردازش زبان طبیعی[1]»شاخهای از علم «هوش مصنوعی[2]» است که به ماشینی کردن فرآیند زبان شناسی سنتی میپردازد. به این ترتیب با استفاده از رایانه میتوان «زبان گفتاری ونوشتاری» را پردازش نمود، به طوریکه رایانهها نیز قادر باشند زبان انسان را درک کرده و بتوانند از زبان طبیعی به عنوان ورودی وخروجی استفاده کند. به این ترتیب یک رایانه، درهنگام دریافت ورودی، نیاز به «درک» و درهنگام ارسال خروجی، نیاز به «تولید» زبان طبیعی دارد. ]81[
در زمینه پردازش زبان طبیعی پژوهشهایی مانند طبقهبندی متون[3]، برچسبگذاری ادات سخن[4]، تعیین و ابهامزدایی از معانی واژگان[5] و… انجام شده است که تنها بر روی یک حوزه خاص تمرکز داشتهاند و در نتیجه راه حلهایی جزئی در راستای اهداف کلی پردازش زبان طبیعی محسوب میشوند. تمامی این حوزههای جزئی باید حل شوند تا در نهایت رایانه بتواند همانند انسان واژگان و جملات را پردازش کرده و یا آنها را بسازد.
برای دانلود متن کامل پایان نامه اینجا کلیک کنید
لینک بالا اشتباه است
:: بازدید از این مطلب : 623
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0